#利用sklearn.preprocessing中适当的函数完成数据的预处理环节:定性数据的编码

# OneHotEncoder编码
from sklearn.preprocessing import OneHotEncoder
import pandas as pd

enc= OneHotEncoder()
df = pd.read_excel("D:\\A_TXT文件\\sheet.xlsx", sheet_name="Sheet1")
#生成新的对象 df_encoded
df_encoded= pd.get_dummies(df, columns=['age', 'income', 'students', 'credit']) 
#分离特征和标签，特征集为X
X = df_encoded.drop('buy', axis=1)
#对fit后的set直接transfrom
X_encoded = enc.fit_transform(X)
#输出样本数据的编码
print("样本的编码为:",X_encoded.toarray())  
#输出特征的取值
print("特征的取值为:",enc.categories_)  
#输出特征的名称
print('特征名称为:',enc.get_feature_names_out())
print(X)